03. 提问

提问

查看页面底部关于此葡萄酒质量数据集的详细信息,以完成下面的练习。

以下哪个问题与此数据集相关?

SOLUTION:
  • 哪些化学特性在预测葡萄酒质量方面最为重要?
  • 是否特定类型的葡萄酒(红葡萄酒或白葡萄酒)的品质更高?
  • 酒精含量更高的葡萄酒是否获得的评价更高?
  • 味道更甜(残糖更多)的葡萄酒是否获得的评价更高?
  • 什么水平的酸度(pH 值)代表质量更高?

QUESTION:

你会如何回答这些问题中的每一个?你将使用此数据集的哪部分?

ANSWER:

你有办法以不同的方式修改或表示数据,以帮助回答此问题吗?

来自 UCI 机器学习实验室的葡萄酒质量数据集

共有两个数据集,提供了有关葡萄牙“青酒”的红葡萄酒和白葡萄酒变体的样本信息。每种样本都由专家做了质量评级,并进行了理化指标检验。由于隐私和物流问题,仅这些理化性质和质量评级的数据可用(例如,没有关于葡萄类型、葡萄酒品牌、葡萄酒销售价格等的数据)。 (来源)

每个数据集中的属性:

# 理化性质 字段名称
1 固定酸度 fixed acidity
2 挥发性酸度 volatile acidity
3 柠檬酸 citric acid
4 残糖 residual sugar
5 氯化物 chlorides
6 游离二氧化硫 free sulfur dioxide
7 总二氧化硫 total sulfur dioxide
8 密度 density
9 pH 值 pH
10 硫酸盐 sulphates
11 酒精度 alcohol
# 质量等级 字段名称
12 质量 - 0 到 10 之间的得分(葡萄酒专家至少 3 次评估的中值) quality